1,462 research outputs found

    Modelização paramétrica de sinais para aplicação em sistemas de conversão texto-fala

    Get PDF
    Neste trabalho foi desenvolvido um sistema de extracção automática de parâmetros de sinais de fala recorrendo a ferramentas de análise cepstral, de predição linear quer pela matriz autocorrelação quer pela matriz covariância, e ao método de análise síncrona com o período fundamental. Realiza-se uma segmentação e classificação dos sinais em vocalizados, não vocalizados ou silêncio. Aos segmentos com conteúdo de fala atribuem-se modelos baseados em formantes. Os parâmetros definidos pelo modelo para a fala vocalizada são 4 formantes e respectivas larguras de banda, frequência fundamental e amplitude. Para os sons não vocalizados considerou-se um modelo com um pólo, um zero e excitação com sinal de ruído aleatório. O método de análise cepstral segmenta o sinal com comprimentos fixos e analisa individualmente cada segmento. A análise de cada segmento consiste na separação das características do trato vocal e da fonte excitadora, recorrendo a uma função de "lifteragem" nas quefrências sendo determinada a frequência fundamental da fonte excitadora ("pitch") e alisado o espectro relativo ao trato vocal. A partir deste espectro alisado ou envelope espectral é aplicado um algoritmo de determinação dos picos para extrair as frequências formantes das ressonâncias do trato vocal obedecendo a constrições respeitantes às regiões de frequências de cada formante e às amplitudes relativas dos respectivos picos. São também determinadas as correspondentes larguras de banda a 3 dB a partir do envelope espectral. Os métodos de predição linear analisam também individualmente cada segmento de comprimento fixo do sinal de fala, obedecendo a um modelo só com pólos, determinando os coeficientes de predição linear por multiplicação matricial. A partir destes coeficientes são determinados os pólos. Cada par de pólos complexos conjugados é considerado um possível formante, sendo posteriormente seleccionados justamente 4 formantes por um processo de eliminação das frequências formantes que não têm a correspondência de um pico na função de transferência do sistema. O método de análise síncrona com o período fundamental determina o sincronismo com o impulso glotal segmentando o sinal em troços de duração de um período, sendo estes posteriormente analisados pelo método de predição linear ( matriz covariância). Posteriormente a sequência de parâmetros é sujeita a um alisamento não linear para corrigir eventuais pontos fora de uma linha definida pelos valores dos parâmetros anteriores e posteriores ("outliers"). Todos estes métodos determinam com razoável fidelidade as frequências formantes dos sinais de fala, contudo, as larguras de banda são mais correctamente determinadas pelo método de predição linear pela matriz covariância. É ainda apresentado o desenvolvimento de um conversor texto-fala para o português baseado num sintetizador de formantes com o mesmo modelo usado na análise para os sinais vocalizados. Os principais resultados obtidos foram a realização acústica de uma lista de 37 fonemas fundamentais, regras de conversão grafema-som na forma tabular, um grupo de regras de concatenação para as estruturas acústica e temporal inerentes aos sons, regras prosódicas elementares e, pronuncia de acrónimos e numerais. Foram ainda desenvolvidas várias ferramentas complementares à análise dos sinais de fala como sejam um espectrógrafo e um outro sintetizador de formantes, exclusivamente computacional e para testes, baseado no modelo com os mesmos parâmetros. Os métodos desenvolvidos foram testados com sinais de fala adequadamente seleccionada e recolhida em sala insonorizada e, registados magneticamente com aparelhagem adequada. Os resultados atingidos satisfazem os objectivos inicialmente propostos para este trabalho

    Deep-learning in identification of vocal pathologies

    Get PDF
    The work consists in a classification problem of four classes of vocal pathologies using one Deep Neural Network. Three groups of features extracted from speech of subjects with Dysphonia, Vocal Fold Paralysis, Laryngitis Chronica and controls were experimented. The best group of features are related with the source: relative jitter, relative shimmer, and HNR. A Deep Neural Network architecture with two levels were experimented. The first level consists in 7 estimators and second level a decision maker. In second level of the Deep Neural Network an accuracy of 39,5% is reached for a diagnosis among the 4 classes under analysis.info:eu-repo/semantics/publishedVersio

    Organisational Structures for Cloud

    Get PDF
    CEMSTelecom companies face increasing competition and decrease in profitability. Cloud computing is one of the best markets to reverse this trend. Creating a new cloud product is however a challenge from both a product development point of view and an organisational point of view. A new cloud product focused on development through partnerships needs the appropriate organisational mechanisms to succeed. In an initial proposal a Partner Management Office was proposed. However the lack of integration between the office and the rest of the company suggested that the use of a matrix organisational structure would be a better fit. I propose a balanced matrix structure to address the duality of dimensions within the product and elaborate on how this structure should be implemented

    Protótipo de eletrocardiograma móvel

    Get PDF
    As doenças cardiovasculares são a principal causa de preocupação a nível mundial, sendo a maioria resultante dos hábitos alimentares. O emergente crescimento tecnológico na área da medicina tem sido de uma enorme importância, resultando em apostas na área da prevenção, diagnóstico, e monitorização de muitas patologias. O recurso a um eletrocardiograma em ambulatório permite a gravação de toda atividade elétrica do coração enquanto o paciente desempenha normalmente as suas tarefas ("ambulatório- liberdade de movimentos"). A monitorização em ambulatório pode ser conhecida também por, eletrocardiograma ambulatório, Holter e ECG 24-horas. O Holter deteta anomalias durante a execução das mais diversificadas tarefas, a monitorização contínua por um longo período de tempo, possibilita o registo de toda atividade cardíaca no decorrer das atividades físicas do dia a dia. Com presente trabalho pretende-se descrever um sistema de monitorização de saúde tendo por base os seguintes subsistemas: recetor de sinais vitais em tempo real, processamento de sinais vitais em tempo real, processamento de sinais de ECG com recurso a um microcontrolador (MCU), possibilitando a visualização da taxa de batimentos cardíacos num LCD e posterior armazenamento em "SDcard"do fluxo de dados digitais previamente convertidos para digital através do MCU, para posterior visualização em PC. Desta forma a realização deste projeto resulta no estudo de uma alternativa de baixo custo como alternativa aos dispositivos já existentes.info:eu-repo/semantics/publishedVersio

    Controlador de luz e temperatura para a criação de canários

    Get PDF
    O trabalho faz parte do desenvolvimento de um controlador de luz que permite simular o amanhecer e anoitecer às horas definidas pelo utilizador e, simultaneamente, controlar a temperatura. O equipamento tem como objetivo ser utilizado para criadouros de aves em que o período reprodutivo pode ser controlado pelo número de horas de luz. O controlo de todo o sistema é efetuado através do microcontrolador ATMEGA328P da Atmel, juntamente com o RTC (Real Time Clock) DS1307+ da Maxim. O controlo da simulação do amanhecer e anoitecer é efetuado através de PWM (Pulse Width Modulation) e o controlo da temperatura através de um relé. O sistema possui também um ecrã LCD onde são fornecidas todas as informações necessárias ao utilizador, tais como, data, hora, temperatura, e permite ao utilizador configurar todo o equipamento por meio de 4 botões. O equipamento tem a capacidade de efetuar dois ciclos distintos, podendo o utilizador optar por utilizar apenas um, ou os dois ciclos. O utilizador pode também definir o início dos ciclos no intervalo diário de 24 horas, pode definir a temperatura alvo do criadouro, pode definir a duração dos ciclos, e pode, caso seja necessário, ajustar as horas do relógio do equipamento. O equipamento encontra-se concluído, e encontra-se apto para ser introduzido num ambiente real.info:eu-repo/semantics/publishedVersio

    Didactic speech synthesizer – acoustic module, formants model

    Get PDF
    Text-to-speech synthesis is lhe main subjecl treated in this work. II will be presented the conslilution of a generic lext-to-speech system conversion, explained lhe functions 01 the various modules and described lhe developmenl lechniques using lhe formants model. The development of a didactic forman! synthesiser under Matlab environmenl will also be described. This didactic synthesiser is inlended for a didactic understanding of lhe formant modelaI speech producllon

    Didactic speech synthesizer – acoustic module, formants model

    Get PDF
    Text-to-speech synthesis is lhe main subjecl treated in this work. II will be presented the conslilution of a generic lext-to-speech system conversion, explained lhe functions 01 the various modules and described lhe developmenl lechniques using lhe formants model. The development of a didactic forman! synthesiser under Matlab environmenl will also be described. This didactic synthesiser is inlended for a didactic understanding of lhe formant modelaI speech producllon

    Help system for medical diagnosis of the electrocardiogram

    Get PDF
    This presentation is part of a work that aims to create an interactive learning medical system of ECG events and pathologies diagnose. The system can be seen as an interactive game in wish the user will practice with ECG signal of several pathologies For this purpose an algorithm was developed that detects the events of the ECG in MATLAB. This paper is focus on the discussion of the algorithm, connections between the ECG and the heart physiology listing several pathologies and their respective ECG patterns. A preparatory smoothing of the signal is performed. The algorithm is now only applicable to the normal ECG. It is based in correlation of events within a period of the ECG, and finds the P wave and T wave searching the peaks under a confined region of the smoothed signal

    Tourism forecasting: time-series analysis of world and regional data

    Get PDF
    This Special Issue was honored with six contribution papers embracing the subject of tourism forecasting. The papers focused on forecasting tourism demand in the USA, Vienna—Austria, Vietnam, Marrakech-Safi region of Morocco, Dubai, and China. The time series were spread from tourism interest in the USA, hotel room demand in Vienna, number of tourists in Vietnam, annual tourist arrivals to the Marrakech-Safi region of Morocco, tourist arrivals to Dubai from the UK and the daily and weekly number of passengers at urban rail transit stations in China. The used datasets, in some cases, included thepandemic period, which was a severe challenge for the forecasting models. The forecasting models used embrace the following parameters: descriptive analysis techniques, seasonal naïve, Error Trend Seasonal (ETS), Seasonal Autoregressive Integrated Moving Average (SARIMA), Trigonometric Seasonality, Box–Cox Transformation, ARMA Errors, Trend and Seasonal Components (TBATS), Seasonal Neural Network Autoregression (Seasonal NNAR), Seasonal NNAR with an external regressor, Artificial Neural Network (ANN) forecasting model, ARIMA, AR, linear regression, Support Vector Regression (SVR), eXtreme Gradient Boosting (XGBoost), Long Short-Term Memory (LSTM) models, ensemble models, Box–Jenkins time series models, and the Facebook Prophet algorithm.info:eu-repo/semantics/publishedVersio
    • …
    corecore